分类:理论背景
一般分类
通常,一个分类器被用来分配一个物体到几个可行类中的一个。例如,你有一个包含柑橘水果的灰度值图像,你已经从图像中国提取了区域,且每个区域代表一种水果。现在,你想从柠檬中分离橘子。为了区分水果,你可以应用一个分类。然后,被提取的水果区域是你的对象,分类的任务就是去决定每个区域是属于类别橘子还是属于柠檬。
为了决定那一个区域属于那一类,你需要有关类与类之间差异和每一个单独类之间相似的知识。这个知识可以通过分析被分类对象典型特征而获得。假设柑橘水果的例子,合适的特征可以是面积(在大多数情况下,橘子是比柠檬大的)和形状,尤其是区域的圆度(橘子的外轮廓比柠檬更接近一个圆)。下图展示了一些橘子和柠檬,它们的区域被提取,且区域的特征面积和圆度被计算。
特征被放在了一个数组中,被称为特征向量。特征向量的特征张成了一个所谓的特征空间,例如,每一个特征被用一个坐标轴描述的向量空间。一般,一个
特征空间有任意维,依靠包含在特征向量中的特征的数量。为了可视化的目的,这里一个2D特征空间被展示。在实际中,更高维的特征空间是非常常见的。
水果的特征向量用一个2D图表可视化出来,如下图,在图表中,一个坐标轴代表面积的值,另一个坐标轴的值代表圆度的值。尽管区域的大小和圆度在变化,我么可以看到它们是局狗的相似去建立簇的。分类器的目标就是去将这些簇分开,并将每一个特征向量分配到这些簇中的一个。这里,橘子和柠檬通过一条直线来分开。所有在线的左下面的物体被分为柠檬,所有在线右下面的物体被分为橘子。
就像我们看到的一样,一个非常小的橘子和一个更圆的柠檬的特征向量是非常接近分割线的。如果小橘子不那么圆,将具有很小的差别数据,特征向量将被不正确的分类。为了最小化错误,大量不同的样本且在一些情况下,额外的特征也是需要的。对于柑橘水果的一个额外的特征可能如灰度值,然后,不是一条直线而是一个平面被用来去分开簇。如果颜色图像
是可行的,你可以将面积和圆度同3通道的灰度值做组合。对于超过3个特征的特征向量,一个n维的平面,也被称为超平面,是需要的。
用分割直线或者超平面的分类器被称为线性分类器。其他的分类器,如非线性分类器,可以用任意表面去分簇,在某些情况下可能会更便利的分开簇。
总之,我们需要一组合适的特征,并且选择最适合特定分类应用的分类器。为了选择最合适的方法,我们必须知道一些可行分类器和算法的基本知识。
欧式和超盒分类器
简单分类器之一就是欧式或者最小距离分类器。在HALCON中,欧式分类对于图像分割是可行的,例如被分类的对象是像素,且特征向量包含像素的灰度值。特征的维数依靠所用图像分割的通道的数量。从几何上理解,这个分类器在簇的中心建立了一个圆(2D,见下图(a))或者一个n维超平面(nD),进而从彼此中分类簇。在HALCON,欧式测试仅仅备用在图像分割中,而不是一般的特征分类或者OCR。因为这种方法仅仅是对低维特征向量是稳定的。
然而,欧式分类器用一个n维的球面,超级盒方法用一个平行于坐标轴的立方,所谓的超级盒,这可以被想象成了再一个多维空间中的阈值方法。即,对于每一类,特征空间中每一坐标轴的特定值得变化是确定的。如果一个特征向量位于一个特定类所有的范围内,它将被指定为归属这个类。超级盒可被覆盖。对于那些分不清的对象,超级盒方法可同其他的分类方法相结合,例如欧式分类或者最大可能性分类。在HALCON中,欧式距离被用且被随着特征向量的变化而加权。
HALCON也提供了对于一般特征超级盒分类的算子,还有OCR。但是,这些几乎没有优势,但是相比于MLP, SVM, GMM和k-NN方法还有许多劣势,所以这里不做过多的描述。